# 极化码串行抵消译码算法延迟性的改进

## 张宇国,周 健

(南京邮电大学 通信与信息工程学院, 南京 210003)

摘 要:由 Arikan 提出的极化码,因其简单的编译码结构引起广泛关注。极化码作为一种高性能的信道编码,编码长度超过 2<sup>10</sup> 会产生优异的性能。在串行抵消 (successive cancelation, SC) 译码算法结构基础上,其译码延迟随码长增加而加剧。通过分析 SC 译码算法,提出一种基于冻结比特的改善 SC 译码算法方案,有效地降低了传统 SC 译码算法的延迟性。算法改进后相比原来可以降低 50%的译码延迟,并引入串行抵消单比特翻转译码算法作为译码补偿,进一步提高译码算法的纠错能力。

关键词:极化码; SC 译码算法; 冻结比特; 译码延迟

中图分类号: TN911.2 doi: 10.3969/j.issn.1001-3695.2017.07.0671

## Improvement of latency in successive cancellation decoder for polar codes

### Zhang Yuguo, Zhou Jian

(College of Electronic Science & Engineering, Nanjing University of Posts & Telecommunications, Nanjing 210003, China)

**Abstract:** Abstruct: The polar codes proposed by Arikan caused much attention due to their simple structure. As a high-performance channel encoding, polar codes will achieve good performances once the code length N is greater than 210. On the basis of the Successive Cancelation (SC) decoding algorithm, the decoding latency increases with the increase of code length. By analysis of the position of frozen bits and the SC decoder architecture, this paper proposed an improved SC decoding algorithm, which effectively reduces the latency of the traditional SC decoder algorithm. The algorithm improves the decoding delay by 50% compared to the original. What's more, it further improves the error correction capability of the decoding algorithm by using the Succession Cancellation Single-Bit-Flipping.

Key Words: polar code, SC decoder algorithm, frozen bit, decoder latency.

### 0 引言

1984年,Shannon 指出在不可靠的信道上实现可靠通信,可以用信道编码技术实现在干扰噪声中有效且可靠的传输信息 [1]。构造可达到信道容量或者逼近信道容量的信道编码具体方法以及寻求可行的相应译码算法是信道编码领域核心研究方向。

近 20 年以来,以 Turbo 码、LDPC 码为代表的信道编码技术,是能够逼近香农信道容量的。虽然这些编码技术在实际应用中有着不错的性能,但相应的编译码理论基础尚不完善,理论上很难证明这些码的最优传输特性。2009 年,Arikan 基于信道极化理论提出极化码,理论界掀起了研究热潮。基于串行抵消译码算法,极化码是能够被严格证明达到信道容量的信道编码方法<sup>[2,3]</sup>。相比于 Turbo 码、LDPC 码,极化码可由简单的编码器和译码器来实现,译码算法无须复杂的迭代计算,编译码时间复杂度仅为  $o(n\log n)$ ,随着码长的增加,复杂度对数增长。虽然极化码编码方案有着很好的抗干扰性能,但是随着编码位

数增加, SC 译码系统的延迟问题随之突显<sup>[4-5]</sup>。针对这一编码不足,下面简要阐述极化码构造原理,并着重分析 SC 译码算法结构,对译码延迟作出改进。

#### 1 极化码

极化码是通过信道极化概念来构建的。信道极化分为两个阶段,分别是信道联合和信道分裂。Erdal Arikan 证明了通过这一线性操作,分裂后的各个子信道的对称容量将呈现两极分化现象。随着信道联合数 N(即编码的码长位数)的增加,部分信道的对称容量趋于 1,而其余子信道的对称容量趋于 0。利用这一信道极化现象构造极化码,在对称容量趋于 1 的子信道上传输 K 个信息比特,在其余子信道上传输冻结比特。冻结比特是收发双方已知的固定比特,默认设置为零,本文所提出的 SC 算法改进正是基于冻结比特这一特性。根据此极化信道提出的编码方案即为极化码,码率为 K/N。

作者简介: 张宇国 (1991-), 男, 安徽肥东人, 硕士, 主要研究方向为现代智能信号处理 (zhangyuguo27@163.com); 周健 (1963-), 男, 副研究员, 博士, 主要研究方向为现代智能信号处理.

#### 1.1 编码步骤

Arikan 论文中是基于二进制输入离散无记忆信道(binarydiscrete memoryless channel, B-DMC) [6]中展开讨论极化码的编 码方案, B-DMC 可表示为  $W(X \rightarrow Y)$ 。基于信道极化现象构 建的编码步骤如下:

### a) 极化信道的可靠性估计。

对于 B-DMC 信道 W,用巴氏参数 Z(W) 来衡量信道的可 靠性。巴氏参数值的大小与信道可靠性呈负相关关系, 即巴氏 参数越小,说明该信道可靠性越大,反之说明该信道可靠性越 小。根据 Arikan 给出的巴氏参数计算公式(针对二进制删除信 道 (Binary Erasure Channel, BEC)):

$$Z(W_N^{(i)}) = \sum_{v_i^N \in Y^N} \sum_{u_i^{i-1} \in X^{i-1}} \sqrt{W_N^{(i)}(y_i^N, u_1^{i-1} \mid 0) W_N^{(i)}(y_i^N, u_1^{i-1} \mid 1)}$$
(1)

计算出各个信道的巴氏参数值,其中 $W_N^{(i)}(y_i^N,u_i^{i-1}|u_i)$ 为序 号 $_{i}$ 的极化信道 $_{N}^{(i)}$ 的信道转移概率。

#### b) 比特混合。

在第一步骤的工作基础上,根据巴氏参数与信道可靠性的 关系选取前 K 个可靠性大的分裂子信道传输消息比特, 在其余 N-K 个分裂子信道传输冻结比特。此时,可以构建出原始比特

### c) 构造生成矩阵。

Arikan 提出的生成矩阵的表达式为

$$G_N = B_N F^{\otimes n} \tag{2}$$

上述式中  $F^{\otimes n}$  表示对矩阵  $F = \begin{pmatrix} 1 & 0 \\ 1 & 1 \end{pmatrix}$  的 n 次克洛内克积。

B, 是排序矩阵, 用以完成比特反序重排操作。最后给出编码公

$$x_1^N = u_1^N G_N \tag{3}$$

 $x_1^N$  即是编码后的比特序列,码长为  $N=2^n$ 。

### 1.2 串行抵消译码

序号 $_i$ 的极化信道 $_{W_N}^{(i)}$ 的输出不仅包括信道接收信号 $_{V_N}^{(i)}$ , 还包括前 $_{i-1}$ 个极化信道的输入 $_{u_{i}}$ 一两个部分,信道转移概率 为

$$W_N^{(i)}(\mathbf{y}_1^N, \mathbf{u}_1^{i-1} \mid \mathbf{u}_i) = \sum_{\mathbf{u}^N = \mathbf{v}^{N-i}} \frac{1}{2^{N-1}} W_N(\mathbf{y}_1^N \mid \mathbf{u}_1^N)$$
 (4)

比特 $u_i^i$ 的估计值 $\hat{u}_i$ 根据接收信号 $y_i^N$ 和部分输出序列 $u_i^{i-1}$ 来进行比特估计,比特估计函数为

$$\hat{u}_{i} = \begin{cases} h_{i}(y_{1}^{N}, \hat{u}_{1}^{i-1}), i \in A \\ u_{i}, i \in A^{c} \end{cases}$$
 (5)

记信息承载信道集合为 $_A$ ,反之记为 $_{A^c}$ 。其中,当 $_{i \in A^c}$ 时,表明该比特是冻结比特,则可以根据收发双方事先约定直 接判决为默认值,以避免在固定位的译码错误。当 $i \in A$ 时,表 明该比特是信息承载, 判决函数为

$$h_{i}(y_{1}^{N}, \hat{u}_{1}^{i-1}) = \begin{cases} 0, L_{N}^{(i)}(y_{1}^{N}, \hat{u}_{1}^{i-1}) \ge 0\\ 1, L_{N}^{(i)}(y_{1}^{N}, \hat{u}_{1}^{i-1}) < 0 \end{cases}$$
 (6)

其中对数似然比计算公式为

$$L_N^{(i)}(y_1^N, \hat{u}_1^{i-1}) = \ln \left( \frac{W_N^{(i)}(y_1^N, \hat{u}_1^{i-1} \mid 0)}{W_N^{(i)}(y_1^N, \hat{u}_1^{i-1} \mid 1)} \right)$$
(7)

为了寻求信息位的译码输出,关键是计算对数似然比  $L_N^{(i)}(y_1^N,\hat{u}_1^{i-1})$ ,可以对其进行递归运算方法[7-9]。接收端得到  $L_{\rm l}^{\scriptscriptstyle (1)}(y_i) = \ln \frac{W(y_i \mid 0)}{W(y_i \mid 1)}$ ,由接收端向接收端逐级递归,求出对数似

然比 $L_N^{(i)}(y_1^N,\hat{u}_1^{i-1})$ ,在进行后续译码判决。

上述 SC 译码过程, 当前第 $_i$ 比特的译码判决会依赖前 $_{i-1}$ 个极化信道的输入 $u^{i-1}$ ,线性依赖特性决定了译码的顺序输出。 假定前 $_i$ 个极化信道的输入 $_{u_i}$ 皆是冻结比特,根据前 $_i$ 个估计比 特序列  $\hat{u}_{i}^{i}$  和  $W_{N}^{(i+1)}$  接收信号  $y_{i}^{N}$  对第 i+1 个比特  $\hat{u}_{i+1}$  进行译码判 决,但是对 $\hat{u}_{i+1}$ 译码可以直接利用冻结比特的默认值进行译码 工作,而无须等待 $u_i^i$ 的译码工作。此时, $u_i^i$ 的译码工作为本文 所需的信息比特造成了译码延迟,造成了不必要的译码开销。

#### 改进的 SC 译码算法 2

针对 SC 译码延迟的研究,现今已经有多种方案提出[10~12]。 在文献[10]中,提出关于输出F和G的归并计算单元(merged processing elements, MPE), 并给出相关定义。图 1 显示文献[10] 中提出的 MPE 计算原理图。尽管这些译码方案改善了译码延 迟,但是硬件实现有着一定困难。



图 1 MPE 模块单元计算



图 2 8 位 SC 译码算法结构

图 2显示了 N=8 的传统 SC 译码算法结构[10],表 1显示了 译码的具体计算单元。分析表1中的数据,对于N位的极化码, 传统 SC 译码算法需要 N-1 个时钟循环来译码。表 2 显示 N=8 时,极化码的具体译码输出情况。N位长的极化码需要的译码 可以分为 N/2 个译码输出步骤,每个步骤输出两个译码比特。 对于阶段 i 需要 2i-1 次运算和 N/2i 个 MPE,故而 MPE 的计算

量如下定义:

$$MPE_{calc} = N/2 \times 1 + N/4 \times 2 + ... + 1 \times 2^{log_2N-1} = N/2 \times log_2N$$
(8)

表 1 8 位 SC 译码算法时钟 时钟 1 7 阶段1 MPE 阶段2 **MPE MPE** 阶段3 MPE MPE MPE MPE 输出  $\hat{\mathbf{u}}_1,\hat{\mathbf{u}}_2$  $\hat{u}_3, \hat{u}_4$  $\hat{u}_{5}, \hat{u}_{6}$  $\hat{\mathbf{u}}_7, \hat{\mathbf{u}}_8$ 

表 2 8 位 SC 译码算法步骤 阶段 译码比特位 **MPEcalc** 2  $\hat{u}_{2i-1},\hat{u}_{2i}$ 步骤1  $\hat{\mathbf{u}}_1,\hat{\mathbf{u}}_2$ 步骤 2  $\hat{u}_3, \hat{u}_4$ 步骤3 û5,û6

步骤 4

û7.û8

对于极化码 (8,4,{4,6,7,8},(0,0,0,0)),表达式解释为根据 巴氏参数计算出各个子信道的可靠性,选取 $u_4,u_5,u_7,u_8$ 作为信 息比特, $u_1,u_2,u_3,u_5$ 为冻结比特,构造 N=8 的混合比特。根据 传统 SC 译码的特性,对第i位的译码不仅仅依赖于分裂后极化 信道的转移概率,还依赖于前;-1位译码输出。从表1获知, 为了获取信息比特位 $u_*$ ,需要前三位译码输出,需要四个时钟 循环的工作量。然而, 前四位的译码输出, 根据混合比特位信 息可知,只有第4位是信息位,前三位是冻结比特。8位的译 码输出需要计算 12 次 MPE  $(8/2 \times log_2 8 = 12)$ 。由表 2 可知, 当第四位译码输出时, 需计算 8 次 MPE, 为了第四位的译码, 付出大约一半的译码延迟代价。综上,在传统 SC 译码带来了 译码延迟的提高,以及随之的译码复杂度的提升。

为了克服这一延迟特性,考虑以下编码方案。将原本的第 4 位信息比特位作为冻结比特,第五位作为信息比特位。先前 的混合比特位方案改为(8,3,{6,7,8},(0,0,0,0,0))。在这种选择方 案下,前四位译码输出是冻结比特,对照表 1,可知原先的 1-4 译码时钟循环计算量是冗余的。所以,译码延迟由原先的7个 时钟循环降低到3个时钟循环。

根据上述方案,从表2中可以看出子过程1和子过程2是 冗余的, MPE 的计算量由 12 下降到 4。在 SC 译码算法中,第 一阶段中 MPE 的输出 out F 用于前半部分译码输出比特的后 续计算,输出 $out_G0$ 和 $out_G1$ 用于后半部份译码输出比特的 后续计算。采改进后的混合比特方案, $u_1,u_2,u_3,u_4$ 是冻结比特, 则输出 out F 的运算是冗余的。图 2 中的第一部分的四个 MPE 运算模块可由四个加法器取代,改进后的译码方案如图 3 所示。 因此,针对8位的极化码,如果前四位作为冻结比特位传输, 则可以采用如图 3 的译码方案,可以降低 57%的译码延迟和减 少 60%的 MPE 计算量。

推广到 N 位的极化码,根据上述译码方案,译码延迟被有 效地降低:

Latency = 
$$(N-1)-N/2 = N/2-1$$
 (9)

图 2 所示的第一阶段的 MPE 运算模块被图 3 中加法器取 代。分析图 1 中 MPE 三个输出,得出加法器的输出计算量为 MPE 计算量的 1/3。改进后的译码方案 MPE 运算量:

$$Num_{MPE} = (N/2) \times 1/3 + (N/2-1) = 2N/3-1$$
 (10)



图 3 改进后的 SC 译码算法结构

通过改进的编译码方案,SC 译码算法的延迟性得到有效的 改善。现在,给出改进后的极化码编译码方案:

- a) 信道可靠性估计,上文中提出的巴氏参数针对 BEC 信 道可靠性估计,针对二进制对称信道(Binary Symmetric Channel, BSC) 信道和加性高斯白噪声信道(Additive White Gaussian Noise, AWGN)则另选估计参数,三种信道选取参数如表 3。
- b) 将原先比特混合方案前 N/2 位中的信息位改变为冻结 比特位。
- c) 为了对上一步骤进行译码补偿, 将原先比特混合方案后 N/2 中的冻结比特位改变为信息比特位。

表 3 不同二进制离散无记忆信道的信道估计参数

|      | BSC | BEC | AWGN |
|------|-----|-----|------|
| 密度进化 | ✓   | ✓   | ✓    |
| 巴氏参数 |     | ✓   |      |
| 高斯近似 |     |     | ✓    |

针对本文前面 8 位极化码示例 (8,4,{4,6,7,8},(0,0,0,0)),可 将原先的信息比特位 4, 变为冻结比特位,再进行译码补偿,将原 先的冻结比特位 u<sub>5</sub> 变为信息比特,改进后的方案  $(8,4,\{5,6,7,8\},(0,0,0,0))$ 

表 4 列出了改进后的 SC 译码算法与传统 SC 译码算法的 性能对比。在相同的编码长度下,算法改进后相比原来可以降 低 50%的译码延迟,减少了 33%的 MPE 运算量。

#### 3 译码补偿及仿真

在改进 SC 算法中,信道可靠性的估计显得尤为重要,会

直接影响比特位转换的选择。本文在后半部分  $(u_{N/2+1} \sim u_N)$  将冻结比特位转换为信息比特位,会給译码性能带来影响。作为译码补偿,引入循环冗余校验码 $[^{13}]$  (Cyclic Redundancy Check, CRC) 模块可作为算法进一步完善的方向。在编码前加入校验码 (-m) 24 位 (-m) 26 位 (-m) 27 位 (-m) 28 位 (-m) 29 位 (-m) 20 位 (-m) 20 位 (-m) 20 位 (-m) 20 位 (-m) 21 位 (-m) 21 位 (-m) 22 位 (-m) 22 位 (-m) 24 位 (-m) 24 位 (-m) 25 位 (-m) 26 位 (-m) 26 位 (-m) 27 位 (-m) 27 位 (-m) 27 位 (-m) 28 位 (-m) 29 位 (-m) 20 位 (-m) 20

串行抵消单比特翻转译码算法<sup>[14]</sup>在循环冗余校验码的基础上可以进一步提高译码性能的算法。在传统 SC 译码中,信道噪声和译码输出的错误传播是导致译码判定出错的主要原因。错误传播在信源每一位的信号间发生,仅影响误比特率。通常信道噪声只引起 1 位错,并且随着信噪比或者码长的增加产生 1 位错的概率更大。因此,只要找到了这个错误位,就可以极大的提高 SC 译码的译码性能。该算法在译码输出结果不能通过循环冗余校验时,将判定序列中不可靠的信息位进行单比特翻转并重新执行 SC 译码。选取输出序列中信息位对数似然比对应值 T个最小判定位,将对应的信息位素引值集合记为 M<sup>[14]</sup>。每次从集合 M 中取出一个值,将对应的判定比特位值翻转,重新进行 SC 译码输出,直至新的码字可以通过 CRC。遍历集合 M 若未得到有效码字,则译码失败。

表 4 改进后的 SC 译码算法与传统译码算法比较(N=1024)

|         | 传统 SC 译码   | 改进译码算法         |
|---------|------------|----------------|
| 编码长度    | N          | N              |
| 信息比特位数  | 0.5N = 512 | 0.4N = 408     |
| MPEcalc | N-1 = 1023 | 2/3N - 1 = 682 |
| 译码延迟系数  | N-1 = 1023 | 2/3N - 1 = 511 |
| 码长/延迟系数 | 1          | 2              |



图 4 改进后 SC 译码算法仿真 (N=1024)

可将单比特翻转算法作为改进 SC 译码算法的译码补偿方案。图 4 的仿真结果表明,译码性能随比特位转换位数增大而趋于线性比例下降。通过单比特翻转算法的引入,译码性能的补偿允许了冻结比特位转换为信息比特位,使译码输出更加可靠。

### 4 结束语

基于分析极化码编码中的冻结比特位置,将其中的一些特定的信息位和冻结比特位进行位置交换,实现新的混合比特方案。根据传统 SC 译码算法结构,减少其中的译码冗余计算,降低译码延迟。算法改进的本质是通过牺牲较低的误码率性能来换取大幅度的减少译码延迟。串行抵消单比特翻转译码算法的引入,可以有效的进行译码补偿,降低误码率。现阶段寻求更好的译码补偿手段值得进一步展开深入研究。

## 参考文献:

- [1] Shannon C E. A mathematical theory of communication [J]. Bell System Technical Journal, 1948, 27 (3): 379-423.
- [2] Arikan E. Channel polarization: a method for constructing capacity-achieving codes for symmetric binary-input memoryless channels [J]. IEEE Trans on Information Theory, 2009, 55 (7): 3051-3073.
- [3] Arikan E. On the origin of polar coding [C]// Proc of IEEE Int. Symp. Inf. Theory. 2015.
- [4] 王实. 5G 移动通信发展趋势与若干关键技术 [J]. 信息通信, 2015, 12: 253-254.
- [5] ESLAMI, ALI, HOSSEIN P N. A practical approach to polar codes [C]// Proc of IEEE Inf. Theory Workshop. 2011.
- [6] 田宝玉. 信息论基础 [M]. 2 版. 北京: 人民邮电出版社, 2016: 32-128.
- [7] 陈凯. 极化编码理论与实用方案研究 [D]. 北京: 北京邮电大学, 2014.
- [8] Andersson M, Rathi V, Thobaben R. Nested polar codes for wiretap and relay channels [J]. IEEE Communications Letters, 2010, 14 (8): 752-754.
- [9] 李超. Polar Codes 编译码算法研究及应用 [D]. 成都: 电子科技大学, 2013
- [10] Zhang C, Parhi K K. Low-latency sequential and overlapped architectures for successive cancellation polar decoder [J]. IEEE Trans on Signal Process, 2013, 61 (10): 2429-2441.
- [11] Yuan B, Parhi K K. Low-latency successive-cancellation polar decoder architecture using 2-bit decoding [J]. IEEE Trans on Circuits and Systems, 2014, 61 (4): 1241-1254.
- [12] Zhang C, Parhi K K. Latency analysis and architecture design of simplified SC polar decoders [J]. IEEE Trans on Circuits Syst. II, Express Briefs, 2014, 61 (2): 115-119.
- [13] 牛凯. 一种循环冗余校验辅助的极化码译码方法: 中国, 201210202279. 2 [P]. 2014-03-26.
- [14] Orion A, Balatsoukas-Stimming A, Andreas B. A low-complexity improved successive cancellation decoder for polar codes [C]// Proc of the 48th IEEE Asilomar Conference on Signals, Systems and Computers. 2014: 2116-2120.